【Day13】一個爬蟲分析項目例子

第 11 屆 iThome 鐵人賽

DAY 13

AI & Data

Python&ML資料分析系列第 13 篇

11th鐵人賽

小魚兒Fischer

2019-09-28 23:57:30

1254 瀏覽

分享至

利用到normalization，requests，jsons，爬取dow指數據

# -*- coding: utf-8 -*-
import json
import re
import requests

def retrieve_dji_list():
    try:
        url = 'http://money.cnn.com/data/dow30/'
        res = requests.get(url)
    except ConnectionError as e:
        print(e)
    pattern = re.compile(
        'class="wsod_symbol">(.*?)<\/a>.*?<span.*?>(.*?)<\/span>.*?\n.*?class="wsod_stream">(.*?)<\/span>')
    dji_list_raw = re.findall(pattern, res.text)
    dji_list = []
    for item in dji_list_raw:
        dji_list.append({
            'code': item[0],
            'name': item[1],
            'price': float(item[2])
        })
    return dji_list


def retrieve_quotes_historical(stock_code, start = '', end = ''):
    quotes = []
    url = 'https://finance.yahoo.com/quote/%s/history?p=%s' % (stock_code, stock_code)
    try:
        r = requests.get(url)
    except ConnectionError as err:
        print(err)
    m = re.findall('"HistoricalPriceStore":{"prices":(.*?),"isPending"', r.text)
    if m:
        quotes = json.loads(m[0])
    quotes = quotes[::-1]
    return [item for item in quotes if not 'type' in item] 
    ```

【Day12】Pandas 分類

【Day14】一個男女電影評分資料分析實例

系列文

Python&ML資料分析共 17 篇

RSS系列文訂閱系列文

9 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

Python&ML資料分析系列 第 13 篇

【Day13】一個爬蟲分析項目例子

尚未有邦友留言

標記使用者

Python&ML資料分析系列第 13 篇